2.1 고전 제어와 현대 제어: 수학적 우아함의 시대

1. 서론: 결정론적 세계관과 제어의 미학

오늘날 로봇 공학이 마주한 거대한 도전, 즉 비정형 환경에서의 적응과 불확실성 극복이라는 과제를 이해하기 위해서는, 우리가 지나온 지적 여정의 출발점을 명확히 복기해야 한다. 현대의 임바디드 AI(Embodied AI)가 데이터와 신경망이라는 거대한 파도 위에서 확률론적 추론을 수행하는 ’학습자(Learner)’라면, 그 이전 세대의 제어 이론은 물리학과 수학적 모델이라는 견고한 대지 위에서 최적의 해를 계산해내는 ’해결사(Solver)’였다. 이 장에서는 1960년대를 전후로 발생한 제어 이론의 패러다임 전환, 즉 주파수 영역(Frequency Domain)의 직관적 예술에서 시간 영역(Time Domain)의 수학적 정밀함으로의 이행을 심도 있게 다룬다.

우리는 이 시기를 ’수학적 우아함(Mathematical Elegance)의 시대’라고 부른다. 이는 단순히 수식이 복잡해졌다는 의미가 아니다. 시스템의 거동을 선형 대수학(Linear Algebra)과 미분 방정식(Differential Equation)이라는 보편적인 언어로 기술함으로써, 엔지니어들은 물리적 실체를 추상적인 상태 공간(State Space)으로 옮겨와 다룰 수 있게 되었다. 이 과정에서 탄생한 선형 2차 조정기(LQR)와 칼만 필터(Kalman Filter)는 단순한 알고리즘을 넘어, 인간이 복잡한 세계를 이해하고 통제하려는 철학적 시도의 정점이었다.

그러나 이 완벽해 보였던 수학적 성(城)은 역설적으로 ’모델링의 한계’라는 현실의 벽 앞에서 균열을 드러내기 시작했다. 본 절에서는 고전 제어의 직관이 왜 우주 경쟁(Space Race)이라는 시대적 요구 속에서 현대 제어로 대체될 수밖에 없었는지, 그리고 현대 제어가 이룩한 ’최적성(Optimality)’의 신화가 훗날 존 도일(John Doyle)의 반례를 통해 어떻게 해체되었는지를 추적한다. 이러한 역사적, 수리적 배경을 이해하는 것은 왜 오늘날의 로봇 공학이 ‘소프트웨어 2.0’, 즉 딥러닝과 강화학습으로 나아갈 수밖에 없었는지를 설명하는 핵심적인 단서가 된다.

2. 주파수 영역의 직관: 고전 제어의 유산

1940년대와 50년대, 제어 공학은 ’고전 제어(Classical Control)’라 불리는 황금기를 구가하고 있었다. 이 시기의 제어 이론은 제임스 와트(James Watt)의 증기 기관 조속기에서 시작된 피드백(Feedback)의 개념을 니콜라스 미노르스키(Nicolas Minorsky), 해리 나이퀴스트(Harry Nyquist), 헨드릭 보드(Hendrik Wade Bode) 등의 선구자들이 체계화한 결과물이었다.1

2.1 전달 함수와 라플라스 변환의 마법

고전 제어의 핵심 철학은 시스템을 ’블랙박스(Black Box)’로 간주하는 입출력(Input-Output) 관점에 있다. 엔지니어들은 시스템 내부의 복잡한 물리적 상호작용—기어의 마찰, 전자의 흐름, 유체의 점성 등—을 미시적으로 분석하는 대신, 입력 신호가 출력 신호로 변환되는 거시적인 비율, 즉 **전달 함수(Transfer Function, $G(s)$ )**에 집중했다.

이 접근법을 가능하게 한 수학적 도구는 라플라스 변환(Laplace Transform)이었다. 시간 $t$ 의 함수로 기술되는 미분 방정식을 복소 변수 $s$ 의 함수로 변환함으로써, 엔지니어들은 미적분 문제를 대수적인 곱셈과 나눗셈 문제로 치환할 수 있었다. 예를 들어, 시간 영역에서의 복잡한 컨볼루션(Convolution) 연산은 $s$ -영역(주파수 영역)에서 단순한 곱셈 $Y(s) = G(s)U(s)$ 로 표현된다.2

이러한 변환은 엔지니어들에게 강력한 직관을 제공했다. 시스템의 극점(Pole)이 복소 평면(s-plane)의 좌반면에 위치하면 시스템은 안정하고, 허수축에 가까울수록 진동 성분이 강해진다는 사실을 시각적으로 확인할 수 있었다.

2.2 루프 쉐이핑(Loop Shaping): 공학적 예술

고전 제어 설계는 엄밀한 최적화 과정이라기보다는 일종의 예술적 기교에 가까웠다. 엔지니어들은 보드 선도(Bode Plot)나 나이퀴스트 선도(Nyquist Plot)와 같은 그래픽 도구를 사용하여 시스템의 주파수 응답을 분석했다. 그들은 이득 여유(Gain Margin)와 위상 여유(Phase Margin)라는 지표를 통해 시스템이 얼마나 안정한지를 판별하고, 제어기(Controller)의 파라미터를 조정하여 원하는 응답 특성을 조각(Shaping)해 나갔다.3

특히 1948년 월터 에반스(Walter Evans)가 제안한 **근궤적법(Root Locus Method)**은 이러한 직관적 설계의 정점이었다. 근궤적법은 제어 이득(Gain) $K$ 가 0에서 무한대로 변할 때, 폐루프 시스템의 극점이 복소 평면 상에서 그리는 궤적을 도식화한 것이다. 엔지니어는 이 궤적을 보며 “이득을 높이면 시스템이 불안정해지겠구나” 혹은 “이득을 이 정도로 설정하면 적절한 감쇠비(Damping Ratio)를 얻을 수 있겠구나“를 직관적으로 판단할 수 있었다.4 앙리 푸앵카레(Henri Poincaré)가 언급했듯, 이러한 “수학적 우아함은 정신의 경제성(Economy of Thought)과 연결되어 있으며, 해결책을 우리 마음의 필요에 적응시키는 과정“이었다.5

2.3 단일 입출력(SISO)의 한계와 시대적 요구

그러나 고전 제어는 태생적인 한계를 안고 있었다. 가장 치명적인 제약은 단일 입력 단일 출력(SISO: Single-Input Single-Output) 시스템에 최적화되어 있다는 점이었다.2 초기의 산업 공정이나 간단한 서보 기구는 하나의 입력(예: 전압)으로 하나의 출력(예: 속도)을 제어하는 구조였기에 문제가 없었다. 하지만 입력과 출력이 여러 개이고 서로 복잡하게 얽혀 있는 **다변수 시스템(MIMO: Multi-Input Multi-Output)**을 다룰 때, 고전 제어의 주파수 영역 기법은 급격히 복잡해졌다.

MIMO 시스템을 고전 제어로 다루기 위해서는 각 입력-출력 쌍에 대한 전달 함수 행렬을 구하고, 채널 간의 간섭(Coupling)을 제거하기 위한 복잡한 디커플링(Decoupling) 기법을 사용해야 했다. 또한, 전달 함수는 선형 시불변(LTI: Linear Time-Invariant) 시스템을 가정하기 때문에, 로켓의 연료 소비로 인한 질량 변화와 같은 시변(Time-Varying) 특성이나 로봇 팔의 동역학에 내재된 비선형성(Nonlinearity)을 다루기에는 근본적인 어려움이 있었다.7

3. 패러다임의 전환: 스푸트니크 충격과 상태 공간의 등장

1957년 10월 4일, 소련이 쏘아 올린 인류 최초의 인공위성 스푸트니크 1호는 전 세계, 특히 미국의 공학계에 엄청난 충격을 주었다. 우주 경쟁(Space Race)의 개막은 제어 이론의 역사에서도 결정적인 분기점이 되었다. 우주 발사체와 위성은 고전 제어가 다루던 시스템과는 차원이 다른 복잡성을 요구했다.

우주선은 수많은 센서와 추진기(Actuator)가 유기적으로 연결된 고차원 MIMO 시스템이었으며, 궤도 역학은 본질적으로 비선형적이었고, 임무 수행 중 시스템의 파라미터가 지속적으로 변하는 시변 시스템이었다. 무엇보다 우주 미션은 극한의 정밀도와 효율성을 요구했다. 연료는 제한적이었고, 궤도 오차는 임무 실패로 직결되었다. 단순히 시스템을 “안정하게” 만드는 것만으로는 부족했으며, 연료 소모를 최소화하거나 도달 시간을 단축하는 “최적(Optimal)” 제어가 절실했다.7

이러한 시대적 소명에 응답하여 1960년대 초반, 루돌프 칼만(R. E. Kalman) 등을 주축으로 한 ‘현대 제어(Modern Control)’ 이론이 등장했다. 현대 제어는 주파수 영역의 $s$ -평면을 떠나 다시 19세기의 미분 방정식이 지배하는 **시간 영역(Time Domain)**으로 회귀했다. 그러나 이는 과거로의 단순한 복귀가 아니었다. 현대 제어는 선형 대수학(Linear Algebra)이라는 강력한 무기를 장착하고, 시스템을 **상태 공간(State Space)**이라는 새로운 프레임워크 위에서 재정의했다.3

3.1 상태(State): 시스템의 모든 기억을 담다

현대 제어 이론의 가장 위대한 지적 도약은 **‘상태(State)’**라는 개념의 도입이다. 상태 변수(State Variable) $x(t)$ 는 시스템의 과거 이력을 모두 요약하고 있으며, 현재의 입력 $u(t)$ 와 함께 미래의 거동을 완벽하게 결정짓는 최소한의 정보 집합으로 정의된다.10

전달 함수가 시스템을 ’입력에서 출력으로 가는 통로’로 보았다면, 상태 공간 모델은 시스템의 ’내부 상태’가 시간에 따라 어떻게 변화하는지를 직접 기술한다. 선형 시스템에 대한 상태 공간 표현법은 다음과 같은 1계 벡터 미분 방정식으로 기술된다:
$\begin{aligned} \dot{x}(t) &= A x(t) + B u(t) \\ y(t) &= C x(t) + D u(t) \end{aligned}$
여기서 각 변수와 행렬은 다음과 같은 물리적 의미를 갖는다:

$x(t) \in \mathbb{R}^n$ : 상태 벡터 (State Vector). 로봇의 관절 각도, 각속도, 위치, 속도 등 시스템의 현재 상황을 나타내는 $n$ 개의 변수들의 집합이다.
$u(t) \in \mathbb{R}^m$ : 입력 벡터 (Input Vector). 모터의 토크, 전압 등 제어기가 시스템에 가하는 $m$ 개의 제어 신호이다.
$y(t) \in \mathbb{R}^p$ : 출력 벡터 (Output Vector). 엔코더, IMU 센서 등을 통해 실제로 관측 가능한 $p$ 개의 측정값이다.
$A \in \mathbb{R}^{n \times n}$ : 시스템 행렬 (System Matrix). 입력이 없을 때 시스템이 어떻게 변화하는지(동역학)를 나타낸다.
$B \in \mathbb{R}^{n \times m}$ : 입력 행렬 (Input Matrix). 제어 입력이 상태 변화에 미치는 영향을 나타낸다.
$C \in \mathbb{R}^{p \times n}$ : 출력 행렬 (Output Matrix). 내부 상태가 센서 데이터로 어떻게 관측되는지를 나타낸다.
$D \in \mathbb{R}^{p \times m}$ : 직달 행렬 (Feedthrough Matrix). 입력이 출력에 직접적인 영향을 미치는 경로를 나타낸다 (물리 시스템에서는 보통 0인 경우가 많다).

이 수식의 진정한 우아함은 그 **보편성(Universality)**에 있다. 1자유도의 간단한 진자 시스템이든, 수십 개의 관절을 가진 휴머노이드 로봇이든, 혹은 거대한 화학 공정 시스템이든, 모든 선형 동적 시스템은 이 $A, B, C, D$ 행렬로 표현될 수 있다. 차원( $n$ )의 크기만 달라질 뿐 수학적 구조는 불변이다.11 이는 컴퓨터를 이용한 수치 해석과 시뮬레이션에 최적화된 형태였으며, 로봇 제어가 소프트웨어 알고리즘으로 구현될 수 있는 기반을 마련했다.

3.2 비교: 고전 제어와 현대 제어의 대조

다음 표는 고전 제어와 현대 제어의 주요 차이점을 요약한다. 이 비교는 두 접근법이 서로 다른 철학적 기반을 가지고 있음을 보여준다.2

구분	고전 제어 (Classical Control)	현대 제어 (Modern Control)
핵심 도구	라플라스 변환, 전달 함수 ( $G(s)$ )	선형 대수학, 상태 공간 방정식 ( $\dot{x}=Ax+Bu$ )
영역 (Domain)	주파수 영역 (Frequency Domain, s-plane)	시간 영역 (Time Domain, t-domain)
적용 대상	SISO, 선형 시불변(LTI) 시스템 중심	MIMO, 시변(Time-Varying), 비선형 시스템 확장 가능
설계 목표	안정성 확보, 과도 응답 특성 (오버슈트, 정착시간)	최적성 (비용 함수 최소화), 상태 추정
접근 방식	루프 쉐이핑, 시행착오적 튜닝, 직관적	모델 기반 해석적 해(Analytical Solution), 체계적
강점	모델 불확실성에 대한 강건성, 물리적 통찰 제공	다변수 시스템의 우아한 처리, 최적 제어 구현
약점	다변수 시스템 설계의 난해함	정확한 수학적 모델 요구 (Modeling Bottleneck)

4. 최적 제어(Optimal Control): LQR의 수학적 미학

현대 제어 이론이 고전 제어와 구별되는 가장 큰 특징은 **최적화(Optimization)**의 도입이다. 고전 제어가 “시스템을 안정하게 만들기 위해 이득(Gain)을 어떻게 조절할까?“라는 질문을 던졌다면, 현대 제어는 “무엇이 **최선(Best)**의 제어인가?“라는 근원적인 질문을 수학적으로 정식화했다. 이 질문에 대한 가장 아름답고 강력한 대답이 바로 **LQR (Linear Quadratic Regulator)**이다.

4.0.1 비용 함수(Cost Function)와 트레이드오프의 수치화

LQR은 제어 목적을 달성하기 위해 지불해야 하는 ’비용’을 수학적으로 정의한다. 일반적으로 무한 시간(Infinite Horizon)에 대한 2차 비용 함수 $J$ 는 다음과 같이 정의된다.12
$J = \int_{0}^{\infty} \left( x(t)^T Q x(t) + u(t)^T R u(t) \right) dt$
이 식은 로봇 공학에서 발생하는 **성능(Performance)**과 효율(Efficiency) 사이의 영원한 트레이드오프를 수학적으로 표현한 것이다.

$x(t)^T Q x(t)$ : 상태 오차에 대한 페널티이다. 상태 $x(t)$ 가 0(목표 지점)에서 멀어질수록 비용이 증가한다. 행렬 $Q$ 는 어떤 상태 변수의 오차를 더 중요하게 생각할지 결정하는 가중치이다.
$u(t)^T R u(t)$ : 제어 입력(에너지)에 대한 페널티이다. 큰 힘이나 토크를 사용할수록 비용이 증가한다. 행렬 $R$ 은 에너지 소비를 얼마나 억제할지 결정한다.

설계자가 $Q$ 의 값을 크게 설정하면, 제어기는 비용을 줄이기 위해 상태 오차를 빠르게 0으로 만들려 할 것이고, 결과적으로 로봇은 빠르고 공격적으로 움직인다. 반면 $R$ 을 크게 설정하면, 제어기는 입력 에너지를 아끼려 할 것이고, 로봇은 느리고 부드럽게 움직일 것이다. LQR은 이 두 가지 상충되는 목표 사이에서, 비용 함수 $J$ 를 최소화하는 유일한(Unique) 최적의 해를 찾아낸다.

4.1 대수 리카티 방정식과 상태 피드백

놀랍게도, 변분법(Calculus of Variations)이나 동적 계획법(Dynamic Programming)을 통해 유도된 이 최적화 문제의 해는 매우 단순한 선형 상태 피드백(State Feedback) 형태로 나타난다.
$u(t) = -K x(t)$
여기서 최적 이득 행렬 $K$ 는 **대수 리카티 방정식(Algebraic Riccati Equation, ARE)**이라는 행렬 방정식을 풀어서 얻어진다.12
$A^T P + P A - P B R^{-1} B^T P + Q = 0$

$K = R^{-1} B^T P$

이 과정은 수학적으로 매우 우아하다. 복잡한 미분 방정식을 푸는 대신, 리카티 방정식이라는 대수적 방정식을 풂으로써 전역적으로 최적(Globally Optimal)인 제어 입력을 얻을 수 있기 때문이다. 해 $P$ 가 양의 정부호(Positive Definite) 행렬로 존재한다면, LQR 제어기가 적용된 폐루프 시스템( $A-BK$ )은 반드시 안정(Stable)하다는 것이 수학적으로 증명되어 있다.12

4.2 LQR의 이론적 강건성: 무한대의 여유

1960-70년대 연구자들을 더욱 매료시킨 것은 LQR이 가진 놀라운 강건성(Robustness) 특성이었다. 이론적으로 LQR 제어기는 다음과 같은 안정성 여유를 보장한다12:

무한대의 이득 여유 (Infinite Gain Margin): 시스템의 이득이 아무리 커져도(모델과 실제 플랜트 사이의 이득 차이), 폐루프 시스템은 불안정해지지 않는다.
최소 60도의 위상 여유 (60 $^\circ$ Phase Margin): 신호 지연이나 위상 왜곡에 대해 상당한 저항력을 가진다.
이득 감소 여유 (Gain Reduction Margin): 이득이 절반( $0.5$ )으로 떨어져도 안정성이 유지된다.

이러한 특성은 현대 제어 이론이 완벽에 가깝다는 믿음을 심어주기에 충분했다. 엔지니어들은 정확한 모델만 있다면, LQR을 통해 안정성과 최적성을 동시에 잡을 수 있다고 믿었다. 이는 훗날 로봇의 동작 생성(Motion Generation)과 궤적 최적화(Trajectory Optimization)의 근간이 되었으며, 오늘날의 모델 예측 제어(MPC)나 강화학습의 보상 함수 설계에도 직접적인 영향을 미치고 있다.

5. 칼만 필터(Kalman Filter): 불확실성 속의 추정

LQR이 “시스템의 모든 상태 $x$ 를 정확히 알고 있다“고 가정하는 이상적인 상황을 다룬다면, 현실은 훨씬 더 지저분하다. 로봇의 센서는 노이즈가 섞여 있고, 모든 상태를 직접 측정할 수 없는 경우(예: 로봇 팔의 각도는 알지만 각속도는 직접 측정하지 못하는 경우)가 대부분이다. 불확실한 현실에서 숨겨진 상태를 찾아내는 문제, 이것이 **추정(Estimation)**의 영역이며, 그 중심에 **칼만 필터(Kalman Filter)**가 있다.

1960년 루돌프 칼만이 발표한 기념비적인 논문 *“A New Approach to Linear Filtering and Prediction Problems”*는 제어 이론뿐만 아니라 통신, 경제학, 그리고 현대 AI의 확률론적 모델링에 이르기까지 지대한 영향을 미쳤다.16

5.1 재귀적 추정과 베이지안의 구현

칼만 필터는 잡음이 섞인 관측 데이터로부터 시스템의 상태를 최적으로 추정하는 알고리즘이다. 그 핵심 원리는 **예측(Prediction)**과 **보정(Correction)**의 끊임없는 순환에 있다. 이는 인지과학에서 말하는 인간의 뇌가 세상을 인식하는 방식—예측 부호화(Predictive Coding)—과도 일맥상통한다.19

예측 단계 (Time Update): “로봇이 지난 0.1초 동안 속도 $v$ 로 움직였으니, 현재 위치는 이만큼 변했을 것이다.”

시스템 모델( $A, B$ )을 사용하여 현재 상태를 예측한다. 이때, 시간이 지남에 따라 예측의 불확실성을 나타내는 오차 공분산 행렬 $P$ 는 커진다.
$\hat{x}_{k|k-1} = A \hat{x}_{k-1|k-1} + B u_{k-1}$

$P_{k|k-1} = A P_{k-1|k-1} A^T + Q_{process}$

보정 단계 (Measurement Update): “하지만 GPS 센서는 위치가 여기라고 말한다. 내 예측과 센서 값 사이의 차이(Residual)를 반영하자.”

실제 측정값 $z_k$ 가 들어오면, 예측값과의 차이를 계산하고 이를 바탕으로 예측값을 수정한다. 이때 ’얼마나 수정할 것인가’를 결정하는 가중치가 바로 **칼만 이득(Kalman Gain, $K_k$ )**이다.
$K_k = P_{k|k-1} C^T (C P_{k|k-1} C^T + R_{sensor})^{-1}\\ \hat{x}_{k|k} = \hat{x}_{k|k-1} + K_k (z_k - C \hat{x}_{k|k-1})$

5.2 칼만 이득의 아름다움과 쌍대성

칼만 필터의 진정한 ’아름다움’은 칼만 이득 $K_k$ 가 상황에 따라 자동적으로, 그리고 최적으로 조절된다는 점에 있다.21

만약 센서 노이즈( $R_{sensor}$ )가 매우 크다면, 식에 의해 $K_k$ 는 작아진다. 즉, 필터는 측정값을 “신뢰하지 않고” 자신의 모델 예측을 더 믿는다.
반대로 모델의 불확실성( $P_{k|k-1}$ )이 크거나 센서가 정밀하다면, $K_k$ 는 커진다. 필터는 측정값을 적극적으로 반영하여 상태를 보정한다.

이러한 메커니즘은 확률론적 로보틱스(Probabilistic Robotics)에서 말하는 **베이지안 필터(Bayesian Filter)**의 가우시안(Gaussian) 구현체이다. 칼만 필터는 모든 오차 분포가 가우시안 분포를 따른다는 가정하에, 평균 제곱 오차(Mean Squared Error)를 최소화하는 최적 추정기(MMSE Estimator)임이 증명되었다.23

더욱 흥미로운 사실은 **LQR 제어기와 칼만 필터의 쌍대성(Duality)**이다. LQR이 비용 함수를 최소화하기 위해 제어 이득을 구하는 수학적 구조와, 칼만 필터가 오차 공분산을 최소화하기 위해 칼만 이득을 구하는 구조는 완전히 동일하다( $A$ 대신 $A^T$ , $B$ 대신 $C^T$ 를 사용하는 대칭성).18 이는 제어(Control)와 추정(Estimation)이 동전의 양면과 같다는 심오한 통찰을 제공하며, 현대 제어 이론의 수학적 완결성을 상징하는 사례로 꼽힌다.

6. LQG와 분리 원리: 우아함의 정점과 균열

LQR 제어기와 칼만 필터 추정기를 결합하면, 센서 노이즈와 프로세스 노이즈가 존재하는 현실적인 상황에서도 최적 제어를 수행할 수 있는 시스템이 완성된다. 이를 LQG (Linear Quadratic Gaussian) 제어기라고 부른다.

LQG의 기반에는 **분리 원리(Separation Principle)**라는 강력한 이론이 깔려 있다. 이 원리는 “선형 시스템에서 최적의 제어기를 설계하는 문제와 최적의 추정기를 설계하는 문제는 서로 독립적이며, 각각 최적으로 설계하여 단순히 연결하기만 해도 전체 시스템은 여전히 최적이다“라고 말한다.25

즉, 엔지니어는 제어기를 설계할 때 상태를 어떻게 추정할지 고민할 필요가 없고, 추정기를 설계할 때 제어 목적을 고려할 필요가 없다. 이는 복잡한 시스템 설계를 모듈화할 수 있게 해주는 마법과도 같은 원리였다.

1970년대 중반까지, 제어 이론가들은 선형 시스템의 세계를 정복했다고 믿었다. 수학적으로 완벽한 모델( $Ax+Bu$ ), 모든 목적을 아우르는 최적화( $J$ ), 불확실성을 다루는 필터(Kalman), 그리고 이들을 잇는 우아한 분리 원리까지. 현대 제어 이론은 흠잡을 데 없는 논리적 완결성을 갖춘 듯 보였다.

6.1 도일의 반례: “보장된 여유는 없다 (There are none)”

그러나 이 ’수학적 우아함’의 시대는 가장 예상치 못한 곳에서 균열을 맞이하게 된다. 1978년, 존 도일(John Doyle)은 *“Guaranteed Margins for LQG Regulators”*라는 논문에서 단 4페이지의 짧은 반례를 통해 LQG 제어기의 치명적인 약점을 폭로했다.26

앞서 LQR은 무한대의 이득 여유와 60도의 위상 여유를 보장한다고 했다. 하지만 도일은 LQR에 칼만 필터를 결합하여 LQG를 구성하는 순간, 이 보장된 여유가 사라진다는 것을 증명했다. 아주 간단한 2차 시스템에서조차, LQG 제어기는 모델링 오차가 조금만 있어도, 혹은 루프 내에 아주 미세한 지연만 발생해도 안정성 여유가 ’0’으로 수렴할 수 있었다. 논문의 초록(Abstract)은 전설적인 세 단어로 구성되어 있었다:

“There are none.” (보장된 여유는 없다.)

이 사건은 현대 제어 이론의 흐름을 다시 한번 뒤바꾸었다. 수학적으로 ’최적(Optimal)’이라는 것이 현실 세계에서 ’강건(Robust)’하다는 것을 의미하지는 않았다. 모델이 현실을 완벽하게 대변하지 못한다면, 모델에 과도하게 최적화된 제어기는 오히려 현실의 작은 불일치에도 쉽게 붕괴될 수 있다는 사실이 밝혀진 것이다. 이 깨달음은 이후 $H_\infty$ 제어와 같은 강건 제어(Robust Control) 이론의 발전을 촉발시켰으며, 더 나아가 모델링 자체가 불가능한 복잡한 환경을 다루기 위해 데이터 기반(Data-Driven) 접근법, 즉 우리가 다음 절들에서 다루게 될 소프트웨어 2.0과 딥러닝 기반의 제어로 나아가는 필연적인 계기가 되었다.28

7. 결론: Solver에서 Learner로의 여정을 위한 초석

고전 제어와 현대 제어의 역사는 인간이 물리 세계를 제어하기 위해 수학적 모델을 어떻게 발전시켜 왔는지를 보여주는 장대한 서사시이다. 고전 제어가 주파수 영역에서 엔지니어의 직관을 도식화했다면, 현대 제어는 이를 시간 영역의 상태 공간으로 옮겨와 컴퓨터가 풀 수 있는 문제(Solver)로 정형화했다.

LQR과 칼만 필터는 단순한 과거의 유물이 아니다. 이들은 오늘날에도 여전히 로봇 제어의 중추적인 역할을 담당하고 있다. 보스턴 다이내믹스(Boston Dynamics)의 아틀라스(Atlas) 로봇이 보여주는 경이로운 균형 감각 뒤에는 빠른 주기로 리카티 방정식을 풀어대는 LQR 기반의 MPC(Model Predictive Control)가 존재하며, 자율주행 자동차가 GPS 신호가 끊긴 터널 속에서도 위치를 잃지 않는 것은 칼만 필터와 그 변형 알고리즘들 덕분이다.13

그러나 도일의 반례가 시사했듯, 수학적 모델링에만 의존하는 접근법은 명확한 한계(Modeling Bottleneck)를 가진다. 우리가 마주할 ’임바디드 AI’의 세계는 선형화할 수 없는 접촉, 예측 불가능한 상호작용, 그리고 수식으로 표현하기엔 너무나 고차원적인 시각적 입력들로 가득 차 있다.

이제 우리는 수학적으로 우아한 ’해석적 해’를 구하는 시대를 지나, 데이터로부터 스스로 해를 ’학습(Learning)’하는 시대로 진입하고 있다. 하지만 그 새로운 여정에서도 상태(State), 비용(Cost), 최적화(Optimization), 그리고 추정(Estimation)이라는 현대 제어의 유산은 형태만 바꾼 채—강화학습의 가치 함수(Value Function)로, 생성 모델의 잠재 공간(Latent Space)으로—여전히 로봇 지능의 핵심 코어로 작동하고 있음을 기억해야 한다. 이어지는 절에서는 이 완벽해 보였던 제어 이론이 현실의 복잡성 앞에서 어떻게 좌절하고, 그 한계를 넘어서기 위해 어떤 새로운 도구들이 등장했는지 살펴볼 것이다.

8. 참고 자료

Control theory - Wikipedia, https://en.wikipedia.org/wiki/Control_theory
Classical vs. Modern Control – Differences and Advantages, https://controlabo.com/en/classic-modern/
What’s the difference between classical and modern control theory and is the former worth learning? : r/ControlTheory - Reddit, https://www.reddit.com/r/ControlTheory/comments/i2rhpf/whats_the_difference_between_classical_and_modern/
Root Locus Method for Control Systems Explained - Turn2Engineering, https://turn2engineering.com/electrical-engineering/control-systems-engineering/root-locus-method
410 quotes on Mathematician Science Quotes - Dictionary of Science Quotations and Scientist Quotes, https://todayinsci.com/QuotationsCategories/M_Cat/Mathematician-Quotations.htm
A comparison of classical and modern controller design : a case study - Pure - Eindhoven University of Technology, https://pure.tue.nl/ws/portalfiles/portal/4279359/9009853.pdf
What is classical control and when is it better than artificial intelligence?, https://journals.co.za/doi/pdf/10.10520/AJA10269185_2
Brief History of Feedback Control - F.L. Lewis, https://lewisgroup.uta.edu/history.htm
Modern Control Theory - A historical perspective -, https://sic.ici.ro/documents/890/Art._6_Issue_1_SIC_2006.pdf
State Space Models. The Linear-Time Alternative to… | by Ravi Sankar Uppala | Nov, 2025 | Medium, https://medium.com/@ravisankarit/state-space-models-a10473c9bd1f
Mathematical Systems Theory I - IEEE Xplore, https://ieeexplore.ieee.org/iel5/9/33927/01618858.pdf
Linear Quadratic Optimal Control - University of Washington, https://faculty.washington.edu/chx/teaching/me547/2_6_CT_LQ_slides.pdf
Extended Kalman Filter based Linear Quadratic Regulator Control for Optical Wireless Communication Alignment - KAUST Repository, https://repository.kaust.edu.sa/bitstreams/337186af-574e-480b-b235-000a625f42d1/download
Introduction to Optimal Control and Estimation - The Open Repository @ Binghamton (The ORB), https://orb.binghamton.edu/cgi/viewcontent.cgi?filename=12&article=1002&context=electrical_fac&type=additional
19 LINEAR QUADRATIC REGULATOR, https://ocw.mit.edu/courses/2-154-maneuvering-and-control-of-surface-and-underwater-vehicles-13-49-fall-2004/2d5318503b8f97d5a5255596fcf2e3f1_lec19.pdf
1960_Kalman - A new approach to linear filtering and prediction problems - Orinal version with comments.pdf, https://skoge.folk.ntnu.no/puublications_others/1960_Kalman%20-%20A%20new%20approach%20to%20linear%20filtering%20and%20prediction%20problems%20-%20Orinal%20version%20with%20comments.pdf
The Seminal Kalman Filter Paper (1960) - UNC Computer Science, https://www.cs.unc.edu/~welch/kalman/kalmanPaper.html
A New Approach to Linear Filtering and Prediction Problems1, https://www.cs.cmu.edu/~motionplanning/papers/sbp_papers/k/Kalman1960.pdf
Kalman filter - Wikipedia, https://en.wikipedia.org/wiki/Kalman_filter
The Mathematics of the Kalman Filter - Alan Zucconi, https://www.alanzucconi.com/2022/07/24/kalman-gain/
In what sense is the Kalman filter optimal? - Signal Processing Stack Exchange, https://dsp.stackexchange.com/questions/78547/in-what-sense-is-the-kalman-filter-optimal
Exposing the Power of the Kalman Filter - Towards Data Science, https://towardsdatascience.com/exposing-the-power-of-the-kalman-filter-1b78621c3f56/
Tutorial: The Kalman Filter - MIT, https://web.mit.edu/kirtley/kirtley/binlustuff/literature/control/Kalman%20filter.pdf
The Kalman filter as the optimal linear minimum mean-squared error multiuser CDMA detector - ResearchGate, https://www.researchgate.net/publication/3080224_The_Kalman_filter_as_the_optimal_linear_minimum_mean-squared_error_multiuser_CDMA_detector
Linear–quadratic–Gaussian control - Wikipedia, https://en.wikipedia.org/wiki/Linear%E2%80%93quadratic%E2%80%93Gaussian_control
Guaranteed Margins for LQG Regulators – CONLab - UT Dallas Research Labs, https://labs.utdallas.edu/conlab/guaranteed-margins-for-lqg-regulators/
Guaranteed Margins for LQG Regulators, https://murray.cds.caltech.edu/images/murray.cds/b/b4/Guaranteed_margins_for_LQG_regulators_-_doyle.pdf
A Comprehensive Review of Theories, Methods, and Techniques for Bottleneck Identification and Management in Manufacturing Systems - MDPI, https://www.mdpi.com/2076-3417/14/17/7712
Competence Amelioration of PMBLDC Motor using LQR- PID, Kalman Filter - ResearchGate, https://www.researchgate.net/profile/Ahmad-Ismail-62/publication/359256861_Competence_Amelioration_of_PMBLDC_Motor_using_LQR-PID_Kalman_Filter-PID_and_LQG_Based_on_Kalman_Filter-PID_optimal_Controllers_for_disturbance_attenuation/links/623194d6069a350c8b91299b/Competence-Amelioration-of-PMBLDC-Motor-using-LQR-PID-Kalman-Filter-PID-and-LQG-Based-on-Kalman-Filter-PID-optimal-Controllers-for-disturbance-attenuation.pdf